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摘要 无 损 的 功能 性 磁 共振 脑 成 像 (functional magnetic resonance imaging, fMRI) 技术 已 经 成 为 
脑 科学 研究 领域 的 重要 研究 手段 之 一 。 然 而 ， 全 球 不 同 实验 室 在 fMRI 数据 的 存储 和 人 处理 流程 
上 存在 一 定 的 分 歧 ， 限 制 了 脑 科学 的 快速 发 展 。 为 了 解决 这 一 问题 ， 最 近 国际 脑 科 学 家 联合 推 
出 了 脑 成 像 数 据 存储 的 标准 化 框架 (Brain Imaging Data Structure, BIDS) ， 以 及 能 够 处 理 以 BIDS 
格式 整理 的 数据 的 应 用 程序 (BIDS APP) 。 本 文 首先 概述 了 BIDS 以 及 BIDS APP 的 处 理 流程 ， 然 
后 讨论 了 由 于 对 BIDS 数据 预 处 理 技 术 的 选择 不 同 所 导致 的 不 同 的 后 续 统 计 分 析 流程 。 面 对 新 
兴 的 BIDS 程序 和 技术 ， 未 来 的 脑 成 像 研究 者 需要 考虑 如 何 将 其 与 传统 的 fMRI 统计 软件 合理 拱 
配 以 期 达到 更 好 的 统计 力度 。 
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磁 共 振 脑 成 像 技 术 在 探究 人 脑 结构 、 功 能 以 及 各 种 与 脑 相关 的 疾病 诊断 中 正 起 着 越 来 越 重 要 


的 作用 。 以 功能 性 磁 共 振 成 像 (functional magnetic resonance imaging，fMRI) 为 关键 词 ， 在 科学 
基金 共享 网 对 已 经 结 题 的 国内 的 科研 项 目 进行 检索 ， 结 果 发 现 一 共有 323 项 认 知 神经 科学 或 医 


学 相关 的 相关 项 目 ， 总 资助 金额 达 数 干 万 人 民 币 。 这 表明 fMRI 技术 已 经 成 为 国内 脑 科 学 相关 


学 科 的 重要 研究 手段 。 

然而 ， 不 同 研究 机 构 乃 至 同一 个 机 构 的 不 同 课题 组 由 于 各 种 各 样 的 原因 ， 在 脑 成 像 数 据 的 存 
放 、 整 理 以 及 处 理 的 方法 上 存在 较 大 的 差别 。 由 于 脑 成 像 数 据 的 处 理 需 要 一 定 的 编程 能 力 ， 这 
种 混乱 和 孤立 的 情况 造成 不 同 的 研究 者 需要 花费 大 量 的 时 间 和 精力 浪费 在 数据 处 理 代 码 的 编写 
和 纠 错 上 。 另 一 方面 ， 近 期 研究 表明 通过 一 些 新 的 预 处 理 技 术 能 够 有 效 降低 功能 性 MRI 数据 中 
噪声 (如 呼吸 、 心 跳 和 头 动 噪声 )， 进 而 提高 脑 成 像 统计 分 析 的 效力 (Behzadi, Restom, Liau, & Liu, 
2007; Pruim et al., 2015)。 但 是 ， 这 些 新 的 预 处 理 技术 本 身 较 为 复杂 ， 学 习 成 本 较 高 ， 种 种 因素 
直接 导致 国内 的 研究 者 对 其 接受 度 不 高 ， 难 以 应 用 到 具体 研究 中 。 为 了 解决 这 两 个 方面 的 问题 ， 
2016 年 由 斯 坦 福 大 学 牵头 ， 剑 桥 、 牛 津 等 多 所 大 学 脑 成 像 中 心 联合 刊 文 ， 推 出 了 一 个 标准 化 
的 脑 成 像 数据 框架 (Brain Imaging Data Structure, BIDS) (Gorgolewski et al., 2016) (图 1) BIDS 


的 推出 意味 着 全 世界 顶级 脑 科学 家 在 脑 成 像 数据 的 整理 和 存储 方面 达成 了 初步 的 共识 。 紧 接着 ， 


在 2017 年 ， 这 些 脑 科学 家 又 推出 了 一 系列 能 够 处 理 以 BIDS 格式 整理 的 数据 的 应 用 程序 (BIDS 


APPs) (Gorgolewski et al., 2017)。 但 是 ， 脑 成 像 数据 的 处 理 一 般 都 需要 几 个 阶段 ， 如 预 处 理 和 
统计 分 析 (包括 个 体 分 析 和 组 分 析 );， 而 目前 的 BIDS APPs 往往 只 针对 其 中 某 一 个 或 几 个 阶段 的 
数据 分 析 。 例 如 斯 坦 福 大 学 开发 的 MRIQC (Esteban et al., 2017) 这 一 软件 专注 于 对 采集 的 原始 数 


据 进行 质量 评估 和 控制 ， 而 fmriprep 这 一 BIDS APP 专注 于 对 通过 质量 得 查 的 数据 进行 预 处 理 。 


虽然 预 处 理 阶 段 BIDS APP 的 整合 使 用 非常 清楚 ( 先 MRIQC 再 fmriprep)， 但 是 目前 如 何 从 预 处 
理 BIDS APP 过 渡 到 传统 的 统计 分 析 的 工具 包 (如 SPM)， 仍 然 令 人 困惑 。 


而 且 ， 近 几 年 一 些 新 提出 的 脑 成 像 数据 预 处 理 技术 让 从 预 处 理 BIDS APP 过 渡 到 传统 的 统计 分 


析 的 工具 包 这 一 过 程 变 得 更 加 复杂 。 新 兴 的 预 处 理 技术 中 具有 代表 性 的 分 别 为 将 主 成 份 分 析 和 
独立 成 分 分 析 应 用 到 预 处 理 中 的 ComCor 和 ICA-AROMA 方法 。ComCor 主要 用 以 分 离 和 提取 生 
理 噪声 的 相关 信号 (Behzadi et al., 2007)， 而 ICA-AROMA 主要 用 以 分 离 和 去 除 头 动 噪声 的 相关 信 


号 (Pruim et al., 2015)。 在 血 氧 水 平 依赖 (blood-oxygen-level dependent, BOLD) 和 动脉 自 旋 标 记 


(Arterial Spin Labelling, ASL) 两 种 静 息 态 fMRI RAGED ATH, ComCor 相 比 传统 的 回归 分 析 方 法 显 
著 降低 了 其 数据 的 时 间 标 准 偏差 ， 而且 ComCor 还 能 提高 BOLD 和 ASL 两 种 任务 态 (视觉 加 工 
任务 ) 脑 成 像 数据 的 统计 功效 。 类 似 地 ，ICA-AROMA 技术 在 静 息 态 和 任务 态 中 的 应 用 同样 比 传 
统 的 回归 方法 更 有 效 地 去 除了 头 动 对 数据 的 干扰 。 但 是 ， 由 于 这 些 方法 提出 的 时 间距 今 较 短 , 
如 何在 预 处 理 中 合理 地 选择 和 使 用 这 些 新 方法 ， 以 及 如 何 合理 地 统筹 预 处 理 和 统计 分 析 的 处 理 
步骤 ， 目 前 没有 可 靠 的 经 验 可 以 参考 。 这 直接 限制 了 新 技术 的 应 用 和 推广 。 

为 了 解决 上 诉 问题 ， 本 文 对 基于 BIDS 数据 预 处 理 过 程 中 两 种 新 兴 的 预 处 理 技 术 的 应 用 ， 以 
及 后 续 的 统计 分 析 流 程 进行 了 概述 和 讨论 ， 归 纳 整 理 了 合理 的 可 行 的 分 析 流 程 ， 试 图 为 国内 的 
脑 成 像 工作 者 提供 的 一 定 的 参考 依据 。 本 研究 把 基于 BIDS 的 数据 分 析 流 程 初步 定义 为 四 步 ， 
下 面 简要 阐述 每 一 步骤 。 

2. BIDS APP 数据 预 处 理 和 后 续 统计 分 析 流 程 探 讨 

在 做 完 fMRI 实验 并 拿 到 原始 的 磁 共振 数据 之 后 ， 脑 成 像 研 究 者 需要 做 的 第 一 步 工 作 就 是 对 原 
始 fMRI 数据 的 存储 格式 进行 了 整理 ， 使 其 组 织 框架 符合 BIDS 的 标准 (图 1) 。 使 fMRI 数据 的 
存储 框架 符合 BIDS 标准 是 使 用 后 续 MRIQC 以 及 fmriprep 等 BIDS APP 的 前 提 。 这 样 只 需要 将 


BIDS 目录 作为 BIDS APP 的 输入 目录 ， 以 及 设置 一 些 简单 的 参数 ，BIDSAPP 就 会 自动 化 地 对 输入 


的 数据 进行 分 析 。 


i dicom_dir/ ie BIDS_dir/ 
ia sub01/ Ws sub01/ 
x run1/ ie func/ 


540738937694186.dcm sub-01_task-run1_bold.nii.gz 


540738937694320.dcm sub-01_task-run1_bold.json 
ie —= ia :…… 
443162413751302.dcm ii 


sub-01_T1w.nii.gz 
443375888851436.dcm 


ie sub02/ 三 sub02/ 
BB .oo Bp .oo 


图 1. 西门子 MRI 机 器 生成 的 原始 dicom 格式 数据 存储 格式 和 转换 之 后 的 nii 格式 的 BIDS 数据 


存储 格式 。 


第 二 步 ， 研 究 者 需要 使 用 MRIQC 工具 包 对 数据 的 质量 情况 进行 检查 ， 剔 除 质量 不 合格 的 被 试 


数据 。MRIQC 和 fmriprep 一 样 是 一 款 基于 BIDS 标准 的 APP， 将 基于 BIDS 格式 的 数据 作为 输入 ， 


可 以 得 到 每 个 被 试 (个 体 水 平 ) 以 及 所 有 被 试 (组 水 平 ) 汇总 的 质量 检测 结果 。MRIQC 提供 了 


ea 


丰富 的 质量 控制 指标 ， 但 由 于 本 文 主 要 关注 预 处 理 和 统计 分 析 的 过 程 ， 故 不 做 过 多 的 描述 
前 研究 者 主要 采用 了 其 中 的 逐 帧 位 移 (Framewise Displacement, FD) 指标 作为 质量 筛选 标准 。 
FD 表示 逐 层 扫描 时 ， 层 与 层 之 间 的 位 移 情 况 ， 也 就 是 即时 头 动 的 情况 。MRIQC 报告 的 FD 是 一 


个 session 过 程 中 的 平均 值 ， 称 之 为 "fd_mean"。 根 据 前 人 文献 ， 建 议 剔除 了 FD (fd_mean) 大 


于 0.2 mm 的 被 试 数据 (Power, Barnes, Snyder, Schlaggar, & Petersen, 2013)。 目 前 开发 者 对 前 两 步 
的 操作 目前 没有 争议 ， 所 以 我 们 建议 所 有 的 数据 先进 行 这 两 步 的 处 理 (数据 整理 + 质量 控制 ) 。 
第 三 步 ， 使 用 fmriprep 对 数据 进行 预 处 理 (图 2) 。 此 时 ， 研 究 者 就 需要 考虑 预 处 理 技术 的 选 


择 问题 。 预 处 理 过 程 中 主要 需要 考虑 的 问题 是 是 否 要 对 数据 进行 ICA-AROMA 分 析 ， 其 他 的 预 


处 理 过 程 和 传统 的 预 处 理 方法 基本 一 致 ， 不 做 过 多 黄 述 。 预 处 理 过 程 中 ，ComCor 和 ICA- 


AROMA 是 在 BOLD 数据 空间 标准 化 操作 完成 后 分 别 独立 进行 的 ， 两 种 方法 之 间 互 不 影响 。 但 两 


种 方法 对 数据 的 处 理 方式 上 差别 很 大 ，ComCor 只 提取 功能 像 数据 中 与 生理 噪声 相关 的 信号 并 
将 其 保存 在 混淆 变量 文件 中 ， 并 不 对 数据 本 身 信 号 进行 操作 ， 而 ICA-AROMA 方法 对 数据 的 操 
作 则 更 为 复杂 。ICA-AROMA 方法 分 为 "激进 "和 " 非 激进 "两 种 类 型 。" 非 激进 "的 ICA-AROMA 方法 
对 数据 进行 了 平滑 ， 分 离 并 去 除了 数据 中 与 头 动 相关 的 噪声 ， 并 生成 了 去 噪 后 的 新 数据 。 而 
ICA-AROMA “激进 “方法 得 到 的 噪声 相关 混淆 变量 只 保存 到 了 混淆 变量 文件 中 ， 并 没有 在 数据 中 
去 除 这 些 噪 声 。 在 预 处 理 过 程 中 ， 研 究 者 可 以 选择 只 使 用 ComCor 而 不 做 ICA-AROMA， 这 样 只 
得 到 空间 标准 化 之 后 的 预 处 理 数 据 以 及 混淆 变量 文件 ， 或 者 两 种 方法 同时 使 用 ， 这 样 除了 可 以 


得 到 空间 标准 化 之 后 的 预 处 理 数据 ， 混 淆 变量 文件 ， 还 可 以 得 到 ICA-AROMA 方法 处 理 过 的 平 


滑 后 的 预 处 理 数据 。 混 淆 变量 文件 中 ，fmriprep 生成 的 混淆 变量 主要 有 三 类 : 头 动 参数 (主要 


取 和 平移 三 个 三 个 方向 和 转动 三 个 方向 6 个 参数 )，ComCor 生成 的 与 生理 噪声 相关 的 成 分 信号 


(一 般 取 aComCor 的 前 5 个 成 分 即 可 ) ， 高 通 滤波 函数 Cosines 相关 参数 。 头 动 和 ComCor 参数 
主要 是 为 了 分 别 去 除 头 动 和 生理 噪声 对 实验 任务 相关 信号 的 影响 。 注 意 Cosines 参数 是 fmriprep 
使 用 离散 余弦 变换 (Discrete Cosine Transform, DCT) 的 方法 产生 的 ， 而 使 用 Cosines 参数 的 目的 
是 为 了 去 除 低频 噪声 的 干扰 。 因 为 SPM 默认 的 高 通 滤 波 功能 所 使 用 的 方法 也 是 离散 余弦 变换 
(Ashburner et al., 2014)， 两 种 方法 在 原理 和 目的 上 没有 差别 ， 所 以 本 研究 中 一 致 采用 了 SPM RK 


认 的 高 通 滤波 来 去 除 低频 噪声 干扰 。 


估计 功能 像 参 考 


头 动 估计 


功能 像 到 结构 像 配 准 
空间 标准 化 


ComCor ICA-AROMA 


1. 空间 标准 化 后 的 预 处 理 数据 | | 1。 去 除 头 动 噪声 和 平滑 后 的 预 处 理 数 据 
2. 混淆 变量 文件 2. 混淆 变量 文件 


图 2. fmriprep 预 处 理 流程 简 


第 三 步 预 处 理 方法 的 选择 不 仅仅 会 产生 不 同 的 预 处 理 结果 ， 也 影响 第 四 步 统 计 分 析 。 预 处 
理 阶 段 方法 的 选择 主要 对 第 四 步 的 统计 分 析 带 来 两 个 问题 : 第 一 ， 选 择 哪 一 方法 产生 的 预 处理 
数据 进行 后 续 的 统计 分 析 ; 第 二 ， 在 统计 分 析 中 需要 回归 掉 哪 些 混淆 变量 。 如 果 选 择 基于 
ComCor 方法 得 到 的 空间 标准 化 之 后 的 预 处 理 数据 ， 那 么 在 个 体 分 析 时 就 需要 加 入 头 动 参数 和 


与 生理 噪声 相关 的 参数 作为 协 变量 ;如果 选择 ICA-AROMA 方 法 处 理 过 的 平滑 后 的 预 处 理 数据 ， 


那么 只 需要 加 入 与 生理 噪声 相关 的 参数 作为 协 变量 。 另 外 一 个 需要 注意 的 事项 就 是 基于 


ComCor 方法 得 到 的 空间 标准 化 之 后 的 预 处 理 数据 是 没有 经 过 平滑 处 理 的 ， 而 ICA-AROMA 方法 


处 理 过 的 数据 是 默认 平滑 过 的 (默认 平滑 核 6*6*6) 。 所 以 ， 对 于 单纯 使 用 ComCor 方法 的 分 析 
流程 ， 研 究 者 还 需要 额外 对 基于 ComCor 方法 得 到 的 空间 标准 化 之 后 的 预 处 理 数据 进行 平滑 处 
理 ， 再 对 平滑 后 的 预 处 理 数据 进行 统计 分 析 。 


新 兴 的 fMRI 数据 整理 标准 BIDS 以 及 相应 的 BIDS APP， 不 仅仅 试图 统一 数据 整理 的 格式 ， 也 


试图 统一 数据 处 理 的 技术 和 流程 。 这 一 趋势 无 疑 给 脑 成 像 研究 者 带 来 了 极 大 的 便利 ， 也 为 脑 成 


像 数据 的 公开 和 共享 铺 平 了 道路 。 但 是 ， 这 些 新 兴 的 技术 和 现 有 的 传统 脑 成 像 数据 处 理 软件 之 
间 的 整合 还 并 不 完善 。 正 如 本 文 所 诉 ， 不 同 的 预 处 理 技 术 的 选择 决定 了 后 续 统计 方法 的 搭配 。 

目前 并 没有 一 个 绝对 的 标准 fMRI 数据 预 处 理 和 统计 流程 。 研 究 者 在 使 用 这 些 新 兴 软 件 和 技术 
时 ， 需 要 根据 自己 的 实际 研究 情况 ， 考 虑 如 何 最 优化 脑 成 像 数据 预 处 理 和 统计 流程 的 问题 。 最 
后 ， 本 文 提供 了 整个 预 处 理 和 和 个体 统 计 分 析 流 程 的 参考 代码 


(https://github.com/ChenSD/BIDS_fmriprep)， 希 望 能 够 为 后 来 者 提供 一 点 便利 。 
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The standardization process of organizing brain imaging data with BIDS and 


discussion of the process pipeline by BIDS APPs 


CHEN ShengDong; GAO Wei; LUO Li; YANG JieMin; YUAN JiaJin 
(Key Laboratory of Cognition and Personality of Ministry of Education, School of 
Psychology, Southwest University, Chongqing 400715, China) 
Abstract The noninvasive functional magnetic resonance imaging (fMRI) technique has been a crucial 
method for brain imaging research. However, the divergence existing in the plethora of datasets 
acquired in the labs around the world limited the rate of progress of brain research. To address this 
issue, international brain scientists jointly proposed a framework named with the Brain Imaging Data 
Structure (BIDS) for organizing and describing neuroimaging data, and developed BIDS APPs for 
analyzing neuroimaging data organized in compliance with the BIDS. The present paper briefly 
introduced BIDS and the fMRI processing pipeline with BIDS APPs. Moreover, we discussed how to 
reasonably integrate the preprocessing pipeline with BIDS APPs (MRIQC and fmriprep) and the 
following statistical analysis. Specifically, we suggested that brain researchers should first organize 
their fMRI data in keeping with BIDS, and then use MRIQC APP to do automated quality control for 
both anatomical and functional MRI data organized in compliance with the BIDS. After eliminating the 
“bad data” (e.g., FD>0.2 mm), fmriprep can then be used to preprocess the “good data.” The fmriprep 
APP introduced two new preprocessing methods (ComCor and ICA-AROMA), which have been 
suggested to be effective in increasing sensitivity to group-level activation. However, it should be noted 
that the choice of fmriprep preprocessing methods determine which regressors should be included in 
the following individual general linear model (GLM). If only ComCor method was used, both the head 
motion related-noise (6 motion parameters) and cardiac and respiratory related-noise should be used 
as nuisance regressors in the following GLM analysis. If both ComCor and ICA-AROMA method were 
used, only regress cardiac and respiratory related-noise but not the head motion related-noise should 


be included in the following GLM analysis. This is because that ICA-AROMA method has removed the 


noise related to head motion in the preprocessed data, whereas ComCor did not. Therefore, regressing 


out motion-related variables in the GLM may reintroduce motion artifacts. We suggest that in the face 
of the emerging BIDS and BIDS APPs, brain researchers need to concern how to combine it with the 
traditional statistical software optimistically in order to attain a better statistical power. 
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